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Introducción 


La  econometría  (textualmente  “medición  económica”)  corresponde  a  un  conjun¬ 
to  de  métodos  estadísticos  empleados  para  analizar  los  fenómenos  que  estudian  los 
economistas.  ¿Cuáles  son  estos  fenómenos?  Podríamos  pensar  que  son  problemas  mi- 
croeconómicos  relacionados  con  la  empresa,  los  consumidores  y  los  mercados,  o  con 
problemas  de  la  macroeconomía  como  los  ciclos  económicos,  el  desempleo,  la  inflación, 
la  inequidad  y  la  eliminación  de  la  pobreza.  Si  bien  esta  noción  es  correcta,  la  verdad  es 
que  los  economistas  claramente  ya  se  aburrieron  de  estudiar  estos  temas  y  han  expandido 
el  abanico  para  incluir  una  serie  de  curiosidades  relacionados  con  medio  ambiente, 
psicología,  cultura,  salud,  felicidad,  racismo,  conflictos  diplomáticos  y  relaciones  de 
pareja,  por  dar  un  par  de  ejemplos.  Es  decir,  hoy  la  economía  como  disciplina  es,  en  las 
palabras  irónicas  del  economista  surcoreano  Ha-Joon  Chang,  “la  explicación  definitiva 
de  la  vida,  el  universo  y  de  todo  lo  que  existe”.2  Aunque  esta  última  descripción  es  un 
tanto  exagerada,  el  punto  es  que  son  pocos  los  temas  que  no  se  estudien  dentro  de  la 
economía. 

¿Cómo  se  explica  que  una  disciplina  originalmente  acotada  se  transformara  en  un 
campo  de  estudio  tan  extensivo?  Parte  de  la  respuesta  se  encuentra  en  la  enorme  versatili¬ 
dad  de  las  herramientas  que  utilizan  los  economistas,  dentro  de  las  cuales  se  encuentran, 
sin  duda,  la  técnicas  econométricas  que  se  presentan  en  este  libro. 

¿De  qué  se  trata,  exactamente,  la  econometría?  Al  menos  en  un  libro  introductorio 
como  este,  la  econometría  es  sinónimo  del  análisis  de  regresión  múltiple.  La  idea 
básica  sobre  la  cuál  se  construye  dicho  análisis  es  que  en  el  mundo  existen  procesos 
(denotemos  a  uno  de  ellos  por  y),  los  cuales  son  consecuencia  de  un  número  de  causales 
(llamemos  a  dos  de  ellas  x  y  z).  Matemáticamente: 

y  =  f(x,z,...)  (1) 

Es  decir,  y  es  una  función  de  x,z  y  otras  variables  explicativas.  ¿Cómo  cambia  y  si 
aumentamos  x,  o  si  disminuimos  z,  o  si  tanto  x  como  z  toman  conjuntamente  los  valores 
3  y  5.5  respectivamente?  Este  es  el  tipo  de  preguntas  que  intenta  responder  la  econome¬ 
tría  mediante  el  análisis  de  regresión.  La  idea  básica  es  tan  general  que  se  aplica  a  un 
sinnúmero  de  problemas  prácticos.  He  a  continuación  un  par  de  ejemplos. 

Ganar  dinero:  En  los  negocios  es  importante  saber  cuál  es  la  curva  de  demanda 
que  tienen  los  productos  ofertados.  Si  aumento  el  precio  (x)  del  yoghurt  en  10%, 


2Esta  es  una  frase  que  Chang  a  repetido  en  varias  conferencias.  Claramente  se  encuentra  parafraseando 
“The  Hitchhiker’s  Guide  to  the  Galaxy”  de  Douglas  Adam. 
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pero  aumento  también  la  visibilidad  del  producto  (z)  de  3  a  6,  ¿aumenta  o  disminuye 
la  cantidad  vendida  (y)?  ¿En  cuánto?  ¿Qué  tan  seguro  estoy  de  mis  resultados?  Las 
técnicas  econométricas  sirven  para  abordar  este  tipo  de  interrogantes.  Por  este  motivo  el 
mercado  laboral  ve  con  muy  buenos  ojos  a  profesionales  con  manejo  avanzado  de  estas 
técnicas.  Los  bancos,  por  ejemplo,  deben  decidir  a  quién  ofrecer  sus  créditos  y  bajo 
qué  condiciones.  Para  ello  deben  calcular  el  perfil  de  riesgo  (y)  del  cliente,  en  función 
de  diversas  variables  explicativas  (x,z,  ■  ■  •)  como  el  nivel  de  ingreso,  la  edad,  el  grado 
académico,  el  número  de  hijos,  etc.  Los  ejecutivos  del  banco  muchas  veces  se  rigen 
por  un  cálculo  “mágico”  que  les  entrega  un  computador.  Bien,  quien  diseñó  ese  cálculo 
mágico  es  un  econometrista  (y  si  sabe  hacer  bien  su  trabajo  puede  ganar  mucho,  mucho 
dinero). 

Para  hacer  análisis  de  regresión  es  fundamental  tener  acceso  a  datos.  Mientras 
más  datos  hayan  a  disposición,  más  valioso  es  el  conocimiento  de  las  herramientas 
estadísticas  para  trabajar  con  ellos.  Como  nos  encontramos  en  la  era  de  la  información 
y  los  datos  guardados  por  compañías  e  instituciones  crecen  de  manera  exponencial,  es 
fácil  imaginar  que  el  dominio  de  la  econometría  irá  ganando  importancia  para  poder 
hacer  negocios  exitosos. 

Para  ilustrar  la  prevalencia  de  la  econometría  en  nuestras  vidas,  piense  que  cada 
vez  que  a  usted  le  piden  su  número  de  identificación  en  un  supermercado,  o  le  ofrecen 
pagar  con  una  tarjeta  de  la  tienda  para  obtener  un  descuento,  sus  transacciones  quedan 
registradas  en  la  empresa.  ¿Con  qué  objetivo?  Si  se  tienen  los  conocimientos  econo- 
métricos  indicados,  la  información  registrada  sirve  para  explorar  muchas  interrogantes. 
Por  dar  un  ejemplo,  si  y  es  el  consumo  de  café  de  una  cliente  de  supermercado  (de  la 
cual  tenemos  registrado  cuál  ha  sido  su  patrón  de  comportamiento  en  el  pasado,  al  igual 
que  el  de  clientes  similares)  podríamos  estudiar  el  valor  esperado  que  debiera  tomar  su 
consumo  (y)  si,  digamos,  le  gusta  el  chocolate  (x)  y  se  publicita  el  café  con  la  imagen  un 
hombre  semi  desnudo  tomando  café  con  un  chocolate  en  la  cama  (z).  No  hay  que  ser  un 
economista  para  saber  que  la  publicidad  aumenta  las  ventas.  La  pregunta  de  oro,  que 
sólo  se  puede  responder  con  herramientas  estadísticas  adecuadas  y  con  un  sabio  uso  de 
ellas,  es  en  cuánto. 

Comprender  el  mundo:  Así  como  el  estudio  de  las  funciones  del  tipo  (1)  sirven 
para  aumentar  las  ventas  y  los  ingresos  de  una  empresa,  también  sirven  para  entender 
una  serie  de  fenómenos  que  nos  rodean.  Una  pregunta  abordada  recientemente  en  una 
prestigiosa  revista  económica  es:  ¿Por  qué  algunos  países  son  más  machistas  que  otros? 
Hoy  se  sabe  que  las  sociedades  primitivas  (al  contrario  de  lo  que  muestran  las  películas) 
no  eran  machistas,  sino  igualitarias  o  incluso  matriarcales.  El  estudio  econométrico 
reveló  que  culturas  que  experimentaron  antes  la  adopción  del  caballo  y  del  arado  desarro¬ 
llaron  una  diferenciación  de  sexo  mayor  y  hoy  son  sociedades  con  menor  participación 
de  la  mujer  en  el  mundo  laboral,  político  y  administrativo.3 

¿Por  qué  son  algunas  personas  más  felices  que  otras?  ¿Por  qué  existe  el  racismo  en 
la  mente  de  unos  y  no  de  otros?  ¿Qué  hay  detrás  de  los  gustos  de  las  personas?  ¿Qué 

3Para  quien  se  interese  en  el  estudio:  Alberto  Alesina,  Paola  Giuliano,  Nathan  Nunn,  2013.  “On  the 
Origins  of  Gender  Roles:  Women  and  the  Plough”,  The  Quarterly  Journal  of  Economics,  vol.  128(2), 
pages  469-530. 
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hace  que  algunos  países  sean  ricos  y  otros  pobres?  Todas  estas  preguntas  y  muchas  otras 
pueden  ser  abordadas  con  las  técnicas  utilizadas  en  la  econometría. 

Pronosticar:  Si  conocemos  la  forma  funcional  /(•)  que  da  origen  a  y,  entonces 
basta  con  conocer  qué  valores  tomarán  las  variables  explicativas  x,z, ...  para  saber 
qué  valor  tomará  y.  Por  ejemplo,  si  y  corresponde  a  los  milímetros  cúbicos  de  lluvia 
caídos  hoy,  mientras  x,z, . . .  corresponden  al  conjunto  de  variables  explicativas  medidas 
ayer  (presión  atmosférica,  temperatura  del  océano,  humedad,  etc.),  entonces  conocer  la 
relación  /(•)  nos  permite  pronosticar  la  lluvia  de  mañana  en  función  de  las  variables 
explicativas  de  hoy. 

Modelos  similares  pueden  ser  aplicados  para  predecir  las  fluctuaciones  cíclicas  de  la 
economía,  el  numero  de  clientes  que  tendrá  una  empresa  el  próximo  año,  el  candidato 
presidencial  que  será  elegido  en  un  país  o  si  un  deudor  será  capaz  de  pagar  sus  deudas. 
En  el  peor  de  los  casos  y  al  estilo  de  las  novelas  de  George  Orwell,  grupos  de  poder 
podrían  hacer  uso  de  cómo  los  celulares  y  computadores  graban  todo  lo  que  hacemos, 
con  quien  nos  relacionamos  y  cómo  pensamos.  A  la  luz  del  alcance  de  estas  herra¬ 
mientas,  cabe  preguntarse:  ¿cuánta  información  sobre  nuestra  vida  privada  debemos 
permitir  recopilar  a  los  servicios  de  inteligencia  o  conglomerados  económicos,  si  esta 
información  puede  ser  utilizada  para  pronosticar  nuestro  comportamiento,  para  aplacar 
movimientos  políticos  que  pudieran  afectar  a  los  intereses  establecidos,  o  simplemente 
ser  vendida  a  empresas  que  hacen  uso  comercial  de  nuestra  vida  privada?  Naturalmente, 
las  predicciones  son  imprecisas,  pero  mejoran  su  calidad  a  medida  que  tenemos  más 
datos  para  realizarlas,  y  vaya  que  crecen  las  bases  de  datos  en  estos  días. 

Ayudar  al  mundo:  Por  fortuna  las  técnicas  empleadas  en  la  econometría  no  sólo 
se  utilizan  para  aumentar  utilidades,  hipnotizar  a  los  clientes  o  mantener  control  total 
de  la  población  al  estilo  orweliano.  Muchos  avances  en  ciencia  y  tecnología  tienen  su 
base  en  el  análisis  de  regresión  múltiple.  Dentro  de  las  aplicaciones  más  destacables 
cabe  mencionar  a  la  medicina.  ¿Cuál  es  la  efectividad,  por  ejemplo,  de  un  medicamento 
para  la  prevención  de  infartos  cardiacos?  La  probabilidad  de  tener  un  infarto  podría  ser 
y,  la  dosis  del  medicamento  x  y  otras  características  del  paciente  z.  Se  podría  estudiar  la 
relación  lineal 

y  =  f(x,z,...)  =  pi+p2X+faz  (2) 

Si  es  negativo,  entonces  el  medicamento  surge  efecto.  La  magnitud  de  P2  nos  interesa 
para  saber  cuán  efectivo  es  el  medicamento.  También  será  de  gran  interés  la  seguridad 
que  se  tiene  respecto  del  valor  estimado  de  fo,  tema  que  será  tratado  con  profundidad  a 
lo  largo  del  texto. 

De  forma  similar  podemos  diseñar  muchas  otras  preguntas  de  utilidad  para  la  huma¬ 
nidad  ¿Cuál  es  el  efecto  de  un  programa  de  capacitación  para  la  reducción  de  la  extrema 
pobreza?  ¿Cuál  es  el  efecto  de  suplementar  la  dieta  de  un  lactante  sobre  su  desarrollo 
cerebral?  ¿Cuáles  son  las  claves  para  evitar  las  guerras,  el  egoísmo  y  fanatismo  de  las 
masas?  La  idea  de  este  libro  es  presentar  las  herramientas  estadísticas  necesarias  para 
abordar  todas  estas  preguntas. 


Capítulo  1 


Mínimos  cuadrados  ordinarios  (MCO) 


1 . 1  ¿Cuándo  será  económicamente  viable  la  energía  solar? 

Hoy  el  mundo  se  abastece  principalmente  de  fuentes  de  energía  fósil,  no  renovable 
y  altamente  contaminante.  Alternativas  renovables  de  energía  con  una  baja  huella  de 
carbono,  como  la  energía  solar  fotovoltaica,  tienen  un  uso  limitado  debido  a  un  alto 
precio  de  producción  y  ciertamente  existen  únicamente  debido  al  aporte  cuantioso  de 
recursos  por  parte  de  un  número  limitado  de  estados  (principalmente  en  Europa).  Para 
poder  competir  de  forma  independiente  con  fuentes  tradicionales,  el  costo  de  la  energía 
fotovoltaica  no  debiera  estar  por  sobre,  digamos,  1  US$/watt-peak.  ¿Será  algún  día  esta 
tecnología  competitiva  en  el  mercado  de  energía? 

En  el  desarrollo  de  toda  tecnología 

observamos  lo  que  se  denomina  técni-  Figura  1.1:  Precio  vs.  experiencia  en  ener- 
camente  una  “curva  de  aprendizaje”:  a 
medida  que  más  uso  se  hace  de  ella, 
más  eficiente  se  vuelve.  Los  paneles  fo- 
tovoltaicos  no  son  la  excepción.  La  fi¬ 
gura  1.1  muestra  la  evolución  del  pre¬ 
cio  medio  por  watt  en  EE.UU.  desde 
1998,  con  el  costo  de  un  watt  en  el 
eje  vertical  y  la  cantidad  acumulada  de 
watts  producidos  desde  los  inicios  de  la 
implementación  de  la  tecnología  en  el 
país.  Resulta  evidente  que  a  mayor  can¬ 
tidad  de  Watts  producidos  baja  el  costo 
de  producción.  Es  decir,  existe  una  co¬ 
rrelación  negativa  entre  amabas  varia¬ 
bles. 

La  figura  1.2  permite  ver  esta  relación  de  forma  más  clara.  En  él  se  presenta  el 
logaritmo  del  costo  en  el  eje  vertical  y  el  logaritmo  de  la  producción  acumulada  en  el 
eje  horizontal,  los  cuales  se  relacionan  de  una  forma  aproximadamente  lineal. 


gía  solar 


Producción  acumulada  [MW] 
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Capítulo  1 .  Mínimos  cuadrados  ordinarios  (MCO) 


Podríamos  aproximar  esta  última  relación  negativa  con  una  función  del  tipo 

y  =/3i+/32  x  +  u  ,  (1.1) 

Costo  (log)  Producción  (log)  Otros  factores 

donde  el  logaritmo  de  la  producción  acumulada  es  la  variable  explicativa  o  inde¬ 
pendiente  (la  llamaremos  simplemente  x ),  y  el  logaritmo  del  costo  por  watt  es  la 
variable  explicada  o  dependiente  (la  cual  denotaremos  con  y). 

Aquello  que  se  escapa  a  la  relación 
lineal  entre  x  e  y  se  captura  en  u,  deno¬ 
minado  error.  Como  vemos  en  la  figura, 
en  torno  al  año  2006  el  precio  de  la  ener¬ 
gía  vio  un  aumento  transitorio,  el  cual  se 
debió  a  un  alza  en  el  precio  del  polisili- 
cio,  una  materia  prima  fundamental  para 
la  elaboración  de  paneles  solares.  En  la 
simplificación  de  la  realidad  que  supone 
(1.1)  este  fenómeno  se  considera  una  de 
las  muchas  variables  que  podrían  entrar  en 
el  error  u.  Si  el  precio  del  policilicio  fuera 
tan  importante  explicando  el  precio  como 
lo  es  el  aprendizaje  a  lo  largo  de  la  curva, 
entonces  tendría  poco  sentido  tratarlo  co¬ 
mo  error  y  en  lugar  de  eso  debiera  figurar 
como  otra  variable  explicativa.  Pero  si  el  efecto  se  neutraliza  en  el  tiempo,  entonces  sí 
puede  tener  sentido  asumir  que  se  trata  de  un  “error”  e  incluso  podríamos  asumir  que 
este  tiene  valor  esperado  de  cero  sobre  todas  las  unidades  i  analizadas, 

E[uí]  =  0.  (1.2) 

Es  decir,  cada  año,  que  denotaremos  con  i,  se  espera  ex  ante  que  todos  los  factores 
que  se  incluyen  en  el  error  sean  cero  (aunque  ex  post  u¡  siempre  será  negativo  o  positivo). 

Suponer  que  el  error  tiene  media  cero  nos  sirve  para  hacer  pronósticos,  pues  con¬ 
siderando  (1.2)  y  suponiendo  que  está  en  nuestras  manos  (o  de  los  estados  financistas) 
decidir  cuánto  se  invertirá  en  energía  solar,  tenemos 

Efo]=jBt  +j82x¿.  (1.3) 

En  palabras,  el  valor  esperado  del  precio  de  energía  solar,  por  ejemplo  en  el  año 
2018,  depende  sólo  de  cuánta  energía  se  decidió  producir  con  paneles  fotovoltaicos 
hasta  esa  fecha.  Así,  dependiendo  de  cuáles  sean  los  valores  de  /3|  y  j82  se  puede  indicar 
cuánto  esfuerzo  hay  que  destinar  a  la  producción  de  energía  solar  para  que  esta  sea 
finalmente  competitiva. 

La  importancia  de  /3i  y  /32  queda  clara  en  la  figura  1.3.  Ahí  se  muestra  que  para 
alcanzar  una  precio  competitivo  de  1  US$  por  watt-peak  se  necesitan  ya  sea  aproxima¬ 
damente  1  millón  de  megawatt  (109)  o  100  millones  de  megawatt  (1011),  ¡una  suma 
bastante  distinta! 


Figura  1.2:  Relación  lineal  en  logaritmos 


Producción  acumulada  [ln(MW)] 


1 .2  Buscando  el  mejor  ajuste:  cálculo  del  estimador  MCO 
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En  definitiva,  nuestra  función  de  pro¬ 
nóstico  (o  función  de  ajuste  y)  va 
a  depender  de  qué  valores  estimemos 
para  los  coeficientes  de  (1.1).  Deno¬ 
taremos  con  /3i  y  /32  a  los  coeficien¬ 
tes  estimados,  para  así  distinguirlos  de 
los  parámetros  “reales”  /3i  y  /32,  cu¬ 
yo  valor  nos  gustaría  saber.  Si  logra¬ 
mos  una  buena  estimación  de  los  coe¬ 
ficientes  y  si  el  supuesto  de  media  ce¬ 
ro  de  los  errores  se  cumple,  entonces 
podremos  hacer  un  pronóstico  acerta¬ 
do. 


Figura  1.3:  ¿Cuándo  se  alcanzará  1 
US$/Wp? 


to1  io3  io5  io7  to9  ío11 

Producción  acumulada  [MW,  escala  log] 


1.2  Buscando  el  mejor  ajuste: 
cálculo  del  estimador  MCO 

En  análisis  de  regresión  contempla  un  gama  de  estimadores  (métodos  de  estima¬ 
ción)  para  los  coeficientes  j8i  y  $2-  El  más  popular  de  ellos  es  el  método  de  mínimos 
cuadrados  ordinarios  (MCO),  también  llamado  método  mínimo  cuadrático  ordina¬ 
rio.  ¿Cómo  se  estiman  /3i  y  $2  con  MCO? 


El  punto  de  partida  es  una  base  de  datos  con  las  variables  que  queremos  relacionar. 
Podemos  ordenarla  como  en  la  tabla  1.1a.  Cada  fila  i  de  la  tabla  se  denomina  una 
observación  y  el  conjunto  de  las  n  =  13  observaciones  se  denomina  muestra.  La 
producción  acumulada  en  MW  y  el  costo  por  Wp  son  las  variables  que  vamos  a  relacio¬ 
nar. 


El  estimador  MCO  fue  diseñado  para  estimar  relaciones  lineales,  es  decir,  rectas  (bi- 
dimensionales  o  multidimensionales).  Como  vemos  en  la  figura  1.1,  la  relación  original 
entre  las  variables  es  no  lineal.  Si  este  es  el  caso  usualmente  podemos  efectuar  alguna 
alteración  a  los  datos  o  al  modelo  para  lograr  la  linealidad  (más  adelante  se  discute  en 
detalle  qué  transformaciones  a  los  datos  pueden  ser  útiles  para  lograr  linealidad  en  casos 
particulares).  En  nuestro  ejemplo  bastó  con  tomar  logaritmos  de  ambas  variables  para 
obtener  una  relación  aproximadamente  lineal. 

Una  vez  que  ya  contamos  con  las  variables  que  se  relacionan  linealmente  entra  en 
juego  el  método  MCO.  Asumimos  que  entre  ellas  existe  una  relación  de  la  forma 

yt  =  J3i  +  /32x¿  +  u¡  E  [uí\  =  0  Vi  (1 .4) 

y  queremos  encontrar  con  los  datos  de  la  muestra  una  función  de  ajuste, 

y  i  =  Ai  +p2*i,  (1-5) 

La  distinción  entre  (1.4)  y  (1.5)  es  importante.  (1.4)  representa  a  la  “realidad”  que  da 
origen  a  los  datos  observados,  pero  que  no  es  observable  en  su  totalidad,  pues  sólo 
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Tabla  1.1:  Precio  de  energía  solar  fotovoltaica:  Ajuste  lineal  para  la  curva  de  aprendizaje 


(a)  Base  cruda  (b)  Transformación  (c)  Ajuste 


Año 

(#  Obs.) 

Prod.  acum. 

[MW] 

Costo 

[$/Wp] 

(Log.  prod.  acum.) 

y 

(Log.  costo) 

y  =  2, 8  —  0,11* 
(Ajuste  lineal) 

ü  =  y-$ 

(Residuo) 

1998 

1 

11.3 

11.99 

2.42 

2.48 

2.52 

-0.04 

1999 

2 

14.2 

11.92 

2.65 

2.48 

2.49 

-0.01 

2000 

3 

18.1 

11.21 

2.9 

2.42 

2.46 

-0.04 

2001 

4 

29.4 

10.82 

3.38 

2.38 

2.41 

-0.03 

2002 

5 

52.1 

10.78 

3.95 

2.38 

2.35 

0.03 

2003 

6 

97.5 

9.79 

4.58 

2.28 

2.28 

0 

2004 

7 

155.2 

9.16 

5.04 

2.21 

2.23 

-0.02 

2005 

8 

234.4 

8.79 

5.46 

2.17 

2.19 

-0.02 

2006 

9 

339 

8.85 

5.83 

2.18 

2.15 

0.03 

2007 

10 

508.1 

8.95 

6.23 

2.19 

2.1 

0.09 

2008 

11 

817.1 

8.6 

6.71 

2.15 

2.05 

0.1 

2009 

12 

1251.8 

8.21 

7.13 

2.11 

2 

0.11 

2010 

13 

2164.5 

6.97 

7.68 

1.94 

1.94 

0 

2011 

14 

3978.2 

6.19 

8.29 

1.82 

1.88 

-0.06 

2012 

15 

6742 

5.31 

8.82 

1.67 

1.82 

-0.15 

Nota:  Precio  en  dólares  del  2012.  Fuente:  Barbóse,  Galen,  Naim  Darghouth,  Samantha  Weaver,  and  Ryan  Wiser.  2013.  Tracking 
the  Sun  VI:  An  Historical  Summary  of  the  Installed  Price  of  Photovoltaics  in  the  United  States  from  1998  to  2012. 


disponemos  de  x  e  y  en  nuestra  base  de  datos,  siendo  /3i  y  /32  y  «  desconocidos.  En 
econometría  se  utilizan  dos  denominaciones  para  referirse  a  esta  “realidad”:  pobla¬ 
ción  o  proceso  generador  de  datos  (PGD).  En  (1.5)  lo  que  se  representa  es  el 
modelo  estimado,  cuyos  coeficientes  estimados  j8i,  /32  pueden  diferir  de  sus  contrapartes 
poblacionales  /3i  y  /32  (en  la  figura  1.3  se  presentan  dos  ajustes  distintos,  basados  en 
métodos  de  estimación  diferentes,  pero  el  PGD  que  dio  origen  a  los  datos  sigue  siendo 
el  mismo  en  ambos  casos). 


Definimos  como  residuo  a  la  diferencia  entre  cada  valor  observado  de  la  variable 
dependiente  y  su  valor  pronosticado  por  la  función  de  ajuste: 

ü¡  =  y  i  -  y  i 

Así,  una  representación  del  modelo  que  queremos  estimar  es 

y  i  =  pl  +P 2Xj+üj. 

Si 

La  pregunta  ahora  es:  dadas  las  cantidades  que  sí  podemos  observar  (jc  e  y),  ¿cómo 
elegimos  valores  de  y  $2  con  el  mejor  ajuste  a  los  datos  observados?  Una  respuesta 
natural  es  buscar  valores  para  los  coeficientes  que  minimicen  la  distancia  entre  la  recta 
estimada  y  la  ubicación  de  los  datos  en  el  plano  (x,y).  Pero  existen  múltiples  formas  de 
minimizar  esta  distancia,  siendo  el  método  MCO  una  forma  particular. 


El  método  de  mínimos  cuadrados  ordinarios  lleva  su  nombre  debido  a  que  la  función 
objetivo  del  problema  de  optimización  a  resolver  es  la  suma  de  los  residuos  cuadrados 
uf.  Matemáticamente  buscamos: 


{j8i,/32}  =  arg  min  ¿  üf 
Pi’íh 


con 


(1.6) 


1 .2  Buscando  el  mejor  ajuste:  cálculo  del  estimador  MCO 
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Note  que  existe  una  gran  diferencia  entre  “residuo”,  que  es  de  la  estimación,  y  “error”  que 
es  de  la  población.  No  podemos  minimizar  los  errores  w¡,  puesto  que  son  inobservables. 
Sin  embargo,  siempre  podremos  observar  el  residuo  (ü¿):  la  diferencia  entre  nuestra  recta 
estimada  (y¡  =  j3i  +  $2X i)  y  el  valor  observado  de  y¡. 

Si  probáramos  con  distintos  valores  aleatorios  para  los  coeficientes  j8i  y  /32,  encontra¬ 
ríamos  que  algunas  combinaciones  arrojarían  una  suma  de  residuos  cuadrados  mayores 
a  las  de  otras  combinaciones,  tal  cual  se  presenta  en  la  figura  1.4. 


¿Cuáles  son  los  valores  exactos  de  /3|  y  /32  que  minimizan  la  suma  de  residuos 
cuadrados?  Una  forma  de  obtener  la  solución  sería  evaluar 


dlü=]üf 

dfr 


=  0 


**4= o 


y  resolver  el  sistema  de  ecuaciones  resultante  de  ambas  condiciones  de  primer  orden. 


Acá  se  optará  por  una  solución  más 
general,  la  que  servirá  también  si  se  de¬ 
ben  estimar  más  de  dos  parámetros.  Esto 
puede  resultar  útil  si,  retomando  el  ejem¬ 
plo  anterior,  usted  cuenta  con  otros  indi¬ 
cadores  numéricos  que  debieran  influir 
en  el  precio  de  la  energía  solar  como,  por 
ejemplo,  el  precio  del  polisilicio. 

En  términos  generales,  cuando  contamos 
con  k  variables  explicativas  (denomina¬ 
dos  reg  resores)  y  n  observaciones,  po¬ 
demos  expresar  el  modelo  de  la  siguiente 
manera: 

y  i  =  Pl+  &2x2,i  +  •  •  ■  +  Pkxk,i  +  W( 

(1.7) 

Como  dicha  relación  se  cumple  para  toda  observación  i  (es  decir,  para  cada  año  de 
nuestro  ejemplo),  también  podemos  representar  (1.7)  con  vectores: 

y  =  P\  1  +$2  x2  +$3  x3  +--  +  At  xk  +  ü  , 

(«X 1)  («XI)  (nxl)  (»Xl)  (nxl)  (nxl) 


cuyos  elementos  son 


y  i 

'  1  " 
1 

J8t  + 

*2,1 

*2,2 

í 2  +  •• 

*fc,l 

xk,2 

Pk  + 

Mi 

Ü2 

~ 

.  yn  . 

1 

.  X2’n  . 

_  xk,n  _ 

Ü„ 

Figura  1.4:  £m?  para  distintas  combinacio¬ 
nes  de  ¡5i  y  j82 


Las  variables  explicativas  pueden  ser  agrupadas  en  una  sola  matriz  de  dimensión  nxk. 


12 


Capítulo  1.  Mínimos  cuadrados  ordinarios  (MCO) 


la  que  denotaremos  con  X.1  De  igual  forma,  los  coeficientes  de  regresión  pueden  ser 
agrupados  en  un  solo  vector  de  dimensión  kx  1 : 


Pese  a  ser  un  escalar,  la  sumatoria  de  residuos  cuadrados  también  tiene  una  representa¬ 
ción  matricial.  Esta  es: 

Y^üf  =  ü'ü=(y-Xp)'{y-Xp) 

i=i 

=  (/  -  (X¡ 8)')  (y-Xp^j  aplicando  (A  +B )'  =  A'  +  B' 

=  (/  —  I B'X'^  (y  —  Xfi'j  aplicando  (AB)'  =  B'A' 

=  y'y  -y'xp-  p'x'y + p'x'xp 

=  y'y -2y'Xp+ p'X'Xp 

En  la  última  equidad  hace  uso  de  ¡3'X'y  =  (¡ 6'X'y)'  =  y'X ¡3 ,  lo  que  se  cumple  debido  a 
que  un  escalar  es  igual  a  su  transpuesta. 

La  idea  ahora  es  encontrar  un  vector  ¡3  que  contenga  los  coeficientes  que  minimicen 
esta  expresión.  Es  decir,  buscamos 

¡3  —  arg mm[uü]  =  arg min  íy'y  —  2y'X ¡3  +  fi'X'Xfi] 

P  P  1  J 

La  minimización  se  puede  obtener  derivando  ü'ü  respecto  a  cada  uno  de  los  k 
coeficientes  contenidos  en  j8,  igualando  a  cero  y  resolviendo  el  sistema  de  k  ecuaciones 
con  k  incógnitas.  Por  fortuna  esta  condición  de  primer  orden  también  se  obtiene  con 
ayuda  de  un  par  de  reglas  de  diferenciación  matricial.  Primero  notemos  que  la  derivada 
de  y'y  respecto  a  ¡3  debe  ser  cero,  de  modo  que 

dü'ü  _  ^dy'Xp  dp'X'Xp 

~df~  d$  +  d$ 

'Para  X  utilizaremos  notación  habitual  en  econometría:  xcj  con  c  =  columna  y  /  =  fila.  Esta  forma 
discrepa  de  la  notación  habitual  del  álgebra  donde  los  elementos  matriciales  se  suelen  representar  en  el 
formato  a y;C. 


1 .2  Buscando  el  mejor  ajuste:  cálculo  del  estimador  MCO 


13 


Luego,  si  consideramos  al  vector  de  1  x  k,  a  =  y'X,  podemos  aplicar  la  regla  general 
qX1)  =  a(i xk)  demostración  se  remite  al  apéndice),  lo  que  equivale  a  —IX' y 

para  el  primer  sumando. 

El  segundo  término  consta  de  una  derivada  un  poco  más  compleja.  Primero  notaremos 
que  el  término  X'X  es  una  matriz  simétrica: 


*1,1  *1,2  • 

••  *1  ,n 

*1,1 

*2,1  • 

■■  */U 

*2,1  *2,2  • 

••  *2,n 

*1,2 

*2,2  • 

••  *ü,2 

*/U  Xk,2  ■ 

••  *fc,n_ 

*1  ,n 

*2  ,n  ■ 

••  *fc,n_ 

'  I”=1*U 

L”=I*U*2,¿  ’ 

••  E”=i*i,¿*fe,í 

I"=1*2,/*U 

Lti- 

y- 

x2,i 

••  L¿Li*2  ,ixk,i 

_l;Li  *jt,¿*u 

L”=l*¡U*2,i  ’ 

ILi  Ai  . 

Siendo  X'X  simétrica  (note  que  YJí=\xux2,í  =  LF=i*2,¿*i,í5  etc.)  podemos  hacer  uso  de 
la  regla  =  2 Az,  válida  siempre  y  cuando  Akxk  sea  simétrica  (ver  demostración  en 

el  apéndice). 


Con  la  derivada  resuelta,  sólo  queda  despejar  el  vector  j8  de 

^  =  -2X'y  +  2X'Xp  =0  (1.8) 

d/5  kx  i 


para  obtener  el  vector  de  coeficientes  estimados  resultante  del  sistema  de  k  ecuaciones 
que  representa  (1.8).  La  solución  es: 


Fórmula:  Estimador  mínimo  cuadrático  ordinario  (MCO) 


j8  = 


(X'X)~lX'y 


(1.9) 


Un  pregunta  importante  en  la  práctica  es:  ¿Bajo  qué  condiciones  existe  una  solución 
(1.9)  para  /3? 

X'y  siempre  existe,  pero  la  existencia  de  {X'X)~]  está  garantizada  sólo  si  es  que  se 
cumple  el  siguiente  supuesto. 


Supuesto  1  (SI):  La  matriz X  tiene  rango  completo. 

rango  [X]  =  k  (SI) 

Para  que  (SI)  se  cumpla,  se  debe  tener  (i)  n  >  k  y  (ii)  ausencia  de  multicolinealidad 
perfecta  (ninguna  columna  de  X  es  linealmente  dependiente  de  otra(s)  columna(s) 
de  la  matriz). 
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Dicho  de  otro  modo,  un  único  conjunto  de  parámetros  j8  es  el  que  minimiza  la  suma 
de  cuadrados  ordinarios  siempre  y  cuando  se  cumpla  SI. 


¿Cómo  hacer  todo  esto? 

■  Abrir  una  base  de  datos.  Para  abrir  los  datos  en  gretl  puede  copiar  la  tabla  1.1a  y  pe¬ 
garlos  en  excel  con  el  siguiente  formato  (nombres  en  primera  fila,  sin  espacios  ni  caracteres 
conflictivos): 


Grabe  la  base  de  datos,  por  ejemplo,  como  C :  \S0LAR.  xlsx.  Abra  gretl  y  pinche  el  segundo 
icono  de  abajo  a  la  izquierda  para  abrir  un  ‘guión  nuevo’ .  En  él  escriba  el  siguiente  comando: 

open  "C:\SOLAR.xlsx" 

Para  ejecutarlo  presione  Ctrl+r. 

■  Graficar  variables.  Pueden  utilizarse  los  comandos  gnuplot  o  scatters: 

gnuplot  Costo  ProdAcum  — output=display  — suppress-f itted 
scatters  Costo;  ProdAcum  — output=display 

■  Crear  una  variable.  El  comando  series  sirve  para  crear  una  nueva  variable.  Por  ejemplo, 
los  logaritmos  se  crean  con: 

series  l_Costo  =  ln(Costo) 
series  l_ProdAcum  =  ln (ProdAcum) 

■  Regresión  MCO.  Por  su  siglas  en  inglés  ( ordinary  least  squares),  el  comando  en  gretl  es  oís. 
Por  ejemplo: 

oís  l_Costo  const  l_ProdAcum 

Note  que  const  representa  a  la  constante  (un  vector  con  unos). 

■  Ajuste  y  residuos.  Tras  efectuar  el  comando  oís  es  posible  acceder  al  ajuste  y  a  los  residuos 
mediante: 

series  Ajuste  =  $yhat 
series  Residuos  =  $uhat 

Incluya  todos  estos  comandos  a  su  guión  y  ejecútelo. 


1 .3  ¿Cómo  afecta  la  inequidad  el  desarrollo  económico  de  los  paíseá'S 


1 .3  ¿Cómo  afecta  la  inequidad  el  desarrollo  económico  de  los 
países? 

En  estos  días  ha  surgido  un  debate  en  torno  a  los  efectos  que  tiene  la  inequidad 
sobre  el  desarrollo  económico  de  las  naciones.  La  visión  tradicional,  basada  en  modelos 
teóricos  de  cómo  afectan  los  impuestos  al  crecimiento  económico,  es  que  la  inequidad 
no  debe  ser  combatida  con  redistribución.  Algunos  economistas,  sin  embargo,  arguyen 
que  la  relación  es  más  compleja,  especialmente  en  el  largo  plazo,  y  que  no  hay  que  sacar 
conclusiones  antes  de  verificar  qué  dicen  los  datos  al  respecto. 


¿Cómo  podríamos  veri¬ 
ficar  la  relación  largoplacis- 
ta  que  existe  entre  inequi¬ 

Tabla  1.2:  Base  de  datos  con  dos  regresores 

dad  y  desarrollo  económi¬ 
co? 

i 

(#  Obs.) 

*2 

*3 

y 

Argentina 

1 

2.50 

4934.4 

9527.6 

Una  alternativa  simple 

Australia 

2 

1.80 

7276.4 

24805.4 

sería  revisar  cómo  se  relacio¬ 

Canadá 

3 

1.80 

7438.6 

24886.0 

na  el  nivel  de  inequidad  en, 

Dinamarca 

4 

1.99 

6581.6 

24233.8 

por  ejemplo,  1950  con  el  in¬ 

Francia 

5 

1.80 

4901.4 

21712.1 

greso  per  cápita  actual.  En  la 

Alemania 

6 

2.23 

3988.3 

20209.6 

tabla  1 .2  se  presentan  datos 

India 

7 

2.79 

638.2 

2887.2 

de  los  pocos  países  para  los 

Japón 

8 

1.71 

2006.0 

21832.7 

cuales  se  tiene  dicha  infor¬ 

Malasia 

9 

2.19 

1405.1 

9527.3 

mación  y  en  la  figura  1.5  se 

Noruega 

10 

1.83 

5361.5 

28030.0 

presenta  gráficamente  la  re¬ 

Singapur 

11 

2.17 

2290.5 

26189.6 

lación  entre  ambas  variables. 

Suecia 

12 

1.72 

6563.0 

24661.9 

Al  parecer,  podríamos 

Suiza 

13 

2.09 

9354.4 

24605.5 

Nota:  Las  variables  s 

on  promedios  de  10  añ< 

as  en  tomo  a  la  fecha  indicada.  El  índice 

postular  que  cada  país  i  = 

de  inequidad  es  el  coeficiente  in 

verso  de  Pareto-Lorenz  de  la  Top  Income  Database. 

1,...,  13  obedece  a  una  rela¬ 
ción  lineal  entre  ambas  va- 

El  PIB  real  per  cápita  es  del  Maddison  Proyect. 

riables  de  la  forma 

Nivel  actual  de  ingreso  =  /3i  +  fc. Inequidad  en  1950  +  Otros  factores,  (1.10) 


donde  el  índice  de  inequidad  es  la  variable  explicativa  o  regresor  (jc),  y  el  nivel  de 
ingreso  per  cápita,  es  la  variable  dependiente  (y).  Aquello  que  se  escapa  a  la  relación 
lineal  entre  x  e  y  se  captura  en  el  error  (u).  Dentro  del  error  podrían  estar,  por  ejemplo, 
políticas  de  estado,  acceso  a  recursos  naturales,  así  como  cualquier  variable  que  afecte 
al  nivel  de  ingreso  per  cápita. 

Note  que  en  (1.10)  se  surgiere  implícitamente  una  causalidad:  y  es  función  de  x. 
Este  es  un  supuesto  importante  que  discutiremos  más  adelante. 

Si  asumimos  que  los  “otros  factores”  son  cero  en  la  media  y  que  se  cumple  la  premisa 
de  causabdad  de  x  hacia  y,  entonces  podemos  plantear 

E[y¿]  =  J3i  +/3  2xi. 


(1.11) 


ló 
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Figura  1.5:  Regresión  lineal 
•104 


Es  decir,  con  conocimiento  de  /3|  y 
fc,  podríamos  predecir  el  nivel  de  ingre¬ 
so  más  probable  que  tendría  un  país  del 
cual  sabemos  cuál  fue  su  nivel  de  inequi¬ 
dad  en  1950.  Si  es  en  realidad  un  pará¬ 
metro  negativo,  entonces  aquellos  países 
que  combatieron  la  inequidad  en  el  pasa¬ 
do  tienen  hoy  un  nivel  de  ingreso  per  cá- 
pita  superior.  Esto  podría  servir  de  ejem¬ 
plo  para  adoptar  políticas  que  reduzcan 
la  inequidad  en  el  presente  para  aumentar 
el  nivel  de  ingreso  de  un  país  en  el  futuro. 
En  cambio,  si  P2  es  positivo,  entonces  la 
redistribución  generaría  un  deterioro  del 
ingreso  per  cápita  del  país,  tal  como  in¬ 
dica  la  teoría  económica  más  convencional.  Por  ello,  más  allá  de  discusiones  éticas, 
conocer  el  valor  de  es  de  gran  importancia  para  poder  elegir  la  política  óptima  de 
crecimiento  económico  de  un  país. 


Inequidad  en  1950  (x) 


Sigamos  con  la  pregunta  ¿cuál  es  el  efecto  de  la  inequidad  sobre  el  nivel  de  ingreso 
en  el  largo  plazo?  e  intentemos  resolverla  con  los  datos  de  la  tabla  1.2.  El  primer 
planteamiento  para  llegar  a  una  respuesta  fue  correr  la  regresión 


PIB2010  =  A  +  /32Incquidad|950  +  ü. 


(MI) 


Figura  1.6:  Ingreso  en  2010  vs.  1950 


o  0,2  0,4  0,6  0,8  1 

PIB  per  cápita  en  1950  .  jq4 


cuyo  resultado,  siendo  X  —  [l  *2] , 
es 


JB 


(. X,X)~1X'y  = 


5,99e  +  04l 
_-l,94e  +  04j 


El  resultado  $2  <  0  no  nos  sorprende 
dado  que  ya  vimos  esta  relación  gráfica¬ 
mente  en  la  figura  1.5. 


Pero,  ¿no  será  que  la  correlación  en¬ 
tre  el  ingreso  actual  y  la  inequidad  en 
1950  se  debe  simplemente  a  que  paí¬ 
ses  con  mayor  nivel  de  ingreso  tienen 
menor  inequidad,  y  los  países  con  poca 
inequidad  ya  tenían  un  ingreso  alto  en 
1950?  (Si  no  entendió  esto,  vuelva  a  leer¬ 
lo) 


En  la  figura  1.6  se  presenta  la  relación  entre  en  ingreso  actual  y  el  ingreso  pasado  de 
los  países  de  la  muestra  junto  con  la  estimación  de 

PIB2010  =  Pi  +  Á2PIB1950  +  ü.  (M2) 


1 .3  ¿Cómo  afecta  la  inequidad  el  desarrollo  económico  de  los  paíseá? 


En  efecto  vemos  que  la  correlación  es  positiva  (/32  >  0),  es  decir,  países  de  alto  in¬ 
greso  de  hoy  ya  tenían  un  alto  ingreso  en  1950.  Por  ende,  resulta  razonable  pensar  que 
la  correlación  entre  el  PIB  de  2010  y  la  inequidad  de  1950  es  espuria:  se  debe  a  que 
ambas  variables  se  correlacionan  con  una  tercera  variable  explicativa,  el  nivel  de  ingreso 
en  1950. 

¿Cómo  saber,  entonces,  si  la  correlación  entre  la  inequidad  pasada  y  el  ingreso 
actual  es  “independiente”  de  el  nivel  de  ingreso  pasado.  La  forma  de  dar  respuesta  a 
la  interrogante  es  correr  una  regresión  con  las  dos  variables  explicativas.  El  modelo  a 
estimar  sería 

PIB20io  =  Pl  +  j32Incquidad|95o  +  j83PIB  1950  +  ü.  (M3) 

Esto  es  lo  que  se  denomina  “controlar”  por  la  variable  PIB  1950  (en  este  contexto  PIB  1950 
es  un  control).  Más  adelante  veremos  cómo  incluir  controles  de  primer  orden  es  funda¬ 
mental  para  un  buen  análisis  econométrico. 

Como  en  M3  X  —  [l  x2  x3] ,  el  estimador  para  /3  dará  un  resultado  distinto.  En 
términos  generales,  si  el  resultado  para  un  coeficiente  de  interés  se  mantuviera  relativa¬ 
mente  constante  pese  a  la  inclusión  de  controles,  cambios  en  el  número  de  observaciones, 
cambios  en  el  periodo  analizado,  etc.,  se  habla  de  un  resultado  robusto  (pues  no  depen¬ 
de  de  la  método  particular  de  estimación). 


Tabla  1.3:  Regresiones  MCO  en  base  a  la  tabla  1.2 
Variable  dependiente:  Ingreso  en  2010 


Modelo 

(MI) 

(M2) 

(M3) 

const 

5.99e+04 

1.16e+04 

4.92e+04 

Inequidad  en  1950 

—  1.94e+04 

—  1.62e+04 

Ingreso  en  1950 

1.79 

0.848 

n 

13 

13 

13 

R2 

0.636 

0.314 

0.731 

Los  resultados  de  las  tres  regresiones  MI,  M2  y  M3  se  presentan  en  la  tabla  1.3. 

Una  primera  conclusión  es  que  el  coeficiente  de  Inequidad1950  mantuvo  su  signo  y  el 
orden  de  magnitud,  es  decir,  resultó  ser  relativamente  robusto  al  control.  El  coeficiente 
de  PIB  1950,  en  cambio,  se  redujo  en  más  de  50%.  Sin  embargo,  se  mantuvo  positivo. 

¿Cómo  interpretamos  los  resultados  de  M3?  En  la  figura  1.6  vemos  países  que  están 
sobre  la  recta  y  bajo  la  recta  estimada.  Argentina,  por  ejemplo,  parece  haber  crecido 
poco  dado  su  nivel  de  ingreso,  al  igual  que  la  India  y  Malasia.  Singapur  y  Japón,  en  tanto, 
se  encuentran  por  sobre  la  recta,  indicando  que  crecieron  más  de  lo  esperado  según  el 
modelo  estimado  M2.  Volviendo  a  la  figura  1.5  vemos  que  Argentina  y  la  India  tenían 
altos  niveles  de  Inequidad1950  mientras  Japón  tenía  niveles  bajos.  Es  decir,  para  algunos 
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países,  lo  que  no  se  pudo  “explicar”  con  PIB1950  sí  se  puede  explicar  con  Inequidad1950. 
De  la  misma  manera,  como  se  aprecia  en  la  figura  1.5,  Alemania  está  por  sobre  la  recta 
del  modelo  MI  y  Malasia  está  por  debajo.  Pero  esa  diferencia  se  puede  explicar  con 
PIB1950:  Alemania  tenía  mayor  ingreso  que  Malasia. 

Así,  el  ajuste  de  M3, 

PIB2010  =  4,92<?  +  04  —  1 ,62c  +  04Inequidad1950  +  0,848PIBi95o, 

nos  entrega  una  relación  multidimensional  entre  la  variable  dependiente  y  los  regresores, 
tal  cual  se  presenta  en  la  figura  1.7.  Malasia,  por  ejemplo,  pese  a  tener  un  nivel  de 
ingreso  similar  al  de  la  India,  logró  un  mayor  ingreso  en  2010,  el  que  se  explica  por  una 
menor  inequidad.  Argentina,  pese  a  tener  un  nivel  de  ingreso  comparable  al  de  Francia  o 
Alemania,  no  se  siguió  desarrollando  debido  a  los  niveles  de  inequidad.  Singapur,  pese  a 
ser  más  equitativo  que  Suiza,  no  ha  logrado  el  nivel  de  ingreso  de  los  Suizos  debido  a 
que  su  ingreso  medio  en  1950  era  muy  bajo. 


Con  esta  lógica,  los  coeficientes 
(5j  son  denominados  coeficientes 
de  correlación  parcial.  Su  inter¬ 
pretación  es:  cuánto  estimamos  que 
cambia  y  si  aumentamos  xj  en  una 
unidad  y  el  resto  de  los  regresores  se 
mantienen  constantes.  Es  decir,  pro¬ 
veen  un  estimador  de 


Figura  1.7:  Representación  de  M3 


Note  que  en  M3  tanto  el  coefi¬ 
ciente  de  Inequidad1950  como  el  de 
Ingreso195()  vieron  reducido  su  impac¬ 
to  respecto  a  los  modelo  MI  y  M2  (es 


Ingreso  1950 


Inequidad  1950 


decir,  el  impacto  se  acerca  a  cero  en  ambos  casos).  ¿Por  qué?  El  resultado  es  común  en  la 
econometría  y  se  da  cuando  existe  cierto  nivel  de  correlación  entre  las  variables  explica¬ 
tivas  (esto  se  denomina  multicolinalidad  imperfecta).  La  idea  se  puede  representar 
gráficamente  con  ayuda  del  diagrama  de  Venn.  Los  círculos  de  la  figura  (1.8)  representan 
la  variación  total  de  cada  una  de  las  variables.  Las  intersecciones  corresponden  a  la 
varianza  común  que  pueda  existir  entre  ellas.  Como  parte  de  la  variación  común  entre 
Ingreso20io  e  Inequidad 1950  es  al  mismo  tiempo  una  variación  común  con  Ingreso1950, 
el  impacto  que  se  atribuye  a  cada  uno  de  los  coeficientes  en  M3  es  menor. 

Así,  si  incluyéramos  una  tercera  variable  que  se  encontrara  correlacionada  con 
la  variable  dependiente  y  con  las  variables  explicativas,  los  coeficientes  cambiarían 
nuevamente.  ¿Perderán  impacto  Inequidad1950  e  Ingreso1950?  Aunque  es  un  escenario 
probable,  la  respuesta  no  es  clara,  pues  depende  de  condiciones  que  estudiaremos  más 
adelante.  Lo  que  sí  sabemos  es  que  la  estimación  cambiará. 


1 .4  Bondad  de  ajuste  y  causalidad 
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Figura  1.8:  Diagrama  de  Yenn 


Las  conclusiones  expuestas  acá  natu¬ 
ralmente  son  fuente  de  controversia  y  no 
deben  ser  tomadas  como  una  verdad  irre¬ 
futable,  sino  como  un  ejemplo  de  la  apli¬ 
cación  del  método  MCO,  su  alcance  y  sus 
limitantes.  Como  veremos  más  adelante, 
todo  resultado  econométrico  es  altamente 
dependiente  de  cuán  correcta  sea  la  es¬ 
pecificación  del  modelo  estimado  y,  na¬ 
turalmente,  de  la  representatividad  de  la 
muestra  que  se  utiliza.  ¿Cómo  cambian 
los  resultados  si  se  incluyeran  observacio¬ 
nes  para  países  como  Polonia  o  Yugoslavia?  ¿Cambian  los  resultados  al  tomar  otros  años 
de  referencia  para  los  regresores  o  la  variable  dependiente?  ¿Se  mantiene  el  resultado 
con  medidas  alternativas  de  inequidad?  Un  trabajo  serio  de  investigación  debe  intentar 
dar  respuesta  a  este  tipo  de  interrogantes  en  un  análisis  de  robustez. 


Presentación  de  múltiples  modelos 

Para  presentar  múltiples  regresiones  existe  el  comando  modeltab: 

modeltab  free  #  para  limpiar  la  tabla 
oís  ingr2010  const  ineql950 
modeltab  add 

oís  ingr2010  const  ingrl950 
modeltab  add 

oís  ingr2010  const  ineql950  ingrl950 
modeltab  add 

modeltab  show  #  para  mostrarla 


1 .4  Bondad  de  ajuste  y  causalidad 

Para  cada  modelo  de  la  tabla  1.3  se  reporta  en  la  última  fila  el  R2  o  coeficiente 
de  determinación.  El  R2  corresponde  a  una  medida  de  bondad  de  ajuste  que  res¬ 
ponde  a  la  pregunta:  ¿qué  fracción  de  la  dispersión  total  de  y  es  explicada  por  la  recta 
(multidimensional)  estimada  Y/3? 


De  todas  las  representaciones  del  R2,  la  más  intuitiva  es: 


R2  =  1 


=  1 


iLi  (yt-y)2 


SiU  (tk-ñj2/*1  _  x  _  var[“] 

L"=iC yi~y)2/n  var[y] 


(note  que  ü  =  0) 


Si  el  modelo  explica  poco,  Yl¡=\  ü2  es  alto  y  el  R2  es  bajo.  En  el  peor  de  los  casos  la 
suma  de  residuos  cuadrados  son  equivalente  a  la  dispersión  de  la  variable  dependiente, 
que  está  dada  por  L”=1(y¿  —  y)2,  y  el  R2  es  cero.  En  el  mejor  de  los  casos  todos  los 
residuos  son  cero  y  el  R2  es  uno.  La  figura  1.9  muestra  el  valor  que  toma  el  coeficiente 
de  una  recta  ajustada  y  =  \ 8i  +  fax  en  distintas  situaciones.  Mientras  en  1 .9d  un  99  % 
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de  la  varianza  de  y  se  captura  con  el  modelo,  en  1 ,9a  sólo  un  4  %  de  dicha  varianza  se 
explica  por  el  modelo  y  un  96%  queda  inexplicada  en  forma  de  residuos. 


Figura  1.9:  Coeficiente  de  determinación  en  distintos  casos 
(a)  R2  =  0.04  (b)  R2  =  0.15  (c)  R2  =  0.61 
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(d)  R2  =  0.99 

(e)  R2  =  0.43 

(f)  R2  =  0.08 
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• 
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X 
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En  el  ejemplo  de  la  tabla  1.3,  como  M3  explica  parte  de  los  residuos  (es  decir  lo  no 
explicado)  de  MI  y  M3,  el  R2  más  alto  de  la  tabla  es  naturalmente  el  de  M3.  Como  regla 
general,  tras  introducir  un  regresor  adicional  a  una  regresión,  el  R2  siempre  será  igual  o 
mayor.  Sin  embargo,  note  que  el  R2  del  modelo  M3  no  corresponde  a  la  suma  de  los  R2 
de  los  modelos  MI  y  M3.  ¿Por  qué?  La  respuesta  se  encuentra  en  el  diagrama  de  Yenn 
(figura  1.8):  0.219  de  lo  que  se  explica  con  MI  también  se  explica  con  M2,  llegando  el 
nuevo  R2  a  0,636  +  0,3 14  -  0,219  =  0,73 1. 

Podemos  decir  que  en  M3  se  explica  el  73  %  de  la  dispersión  del  ingreso  medio  de 
los  países  tan  sólo  con  dos  regresores:  el  ingreso  medio  del  país  en  1950  y  su  desigualdad 
de  ingresos  en  ese  mismo  año.  En  otras  palabras,  al  incluir  otras  variables  explicativas 
como,  por  ejemplo,  la  abundancia  de  recursos  productivos,  sólo  podríamos  mejorar  en 
un  máximo  de  27  %  nuetra  explicación  de  y. 

Pero  hay  que  ser  cuidadosos,  porque  la  capacidad  de  “explicar”  algo  que  sucedió 
no  es  equivalente  a  la  capacidad  de  predecir  qué  va  a  ocurrir  en  el  futuro.  Por  motivos 
que  quedarán  claros  más  adelante,  incluso  un  modelo  con  un  R2  de  1  puede  tener  nula 
capacidad  predictiva  (es  decir,  el  modelo  sería  inservible).  Mientras  que  otro  modelo 
con  un  R2  de  tan  sólo  30  %  puede  tener  una  exelente  capacidad  predictiva. 

Para  ilustrar  cómo  la  bondad  de  ajuste  o  “variación  explicada”  puede  ser  un  engaño, 
considere  la  posibilidad  de  que  los  países  que  han  logrado  un  elevado  nivel  de  ingreso 
per  cápita  lo  han  logrado  gracias  a  un  espíritu  colectivista  que  mejora  la  productividad 
de  las  empresas  por  medio  de  un  buen  trabajo  en  equipo.  Suponga  además  que  quienes 
comparten  ese  espíritu  también  votan  a  favor  de  políticas  redistributivas.  ¿Cuál  va  a  ser 
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el  resultado?  La  baja  inequidad  aparecería  como  buena  variable  explicativa  debido  a 
que  está  operando  como  proxy  de  la  variable  fundamental,  que  sería  colectivismo.  Si 
un  país  aumenta  la  equidad  pero  el  colectivismo  se  mantiene  inalterado,  entonces  la 
política  redistributiva  no  tiene  ningún  efecto  sobre  el  nivel  de  ingreso.  En  conclusión, 
“la  bondad  de  ajuste”  no  sería  ningún  indicador  de  la  “bondad  del  modelo”,  debido  a  la 
presencia  de  una  correlación  espuria.  Un  alto  R2  es  sinónimo  de  una  alta  correlación, 
pero  correlación  no  siempre  implica  causalidad. 


Origen  de  una  correlación 

1 .  Casualidad  directa  — y  x  causa  y.  Figura  1.10:  Pensamiento  crítico 

2.  Causalidad  inversa  — y  y  causa 
x. 

3.  Causalidad  simultánea  — y  x  cau¬ 
sa  y  e  y  causa  x. 

4.  Correlación  espuria  — y  Tanto  x 
como  y  son  causa  de  un  factor 
común  z. 

5.  Correlación  casual  — y  No  hay 
causalidad. 


n 


THENJ  X  TCCK  A 
SmSTlCSÜASS. 
NOWI  DMt 


1  WEU.,  rwe 

tí 


Sacado  de  xkcd.cc 


Para  ilustrar  la  relación  entre  causalidad, 

correlación  y  proxy,  la  figura  1.11  muestra  el  Figura  1.11:  Precio  del  watt  fotovoltai- 
ajuste  co 


precio  =  877,83  -0,433año  (1.12) 

(R2  =  0,95) 

Según  esta  estimación  el  precio  de  1  dólar  por 
watt  se  alcanzaría  en  torno  al  año  2028.  El 
R2  de  la  regresión  es  superior  al  de  la  regre¬ 
sión  ln(precio)  =  2,8  —  0,131n(prod.  acum) 
de  la  de  la  figura  1.3,  cuyo  valor  es  R2  = 
0,92. 


Año 


Figura  1.12:  Producción  fotovoltaica 


|  6,000 


¿Qué  modelo  otorga  una  predicción  más 
confiable? 

En  la  figura  1.12  se  muestra  cómo  ha  creci¬ 
do  la  producción  acumulada  de  watts  produci¬ 
dos  con  energía  solar  fotovoltaica  a  lo  largo  de 
los  años.  Como  vemos,  la  correlación  es  posi¬ 
tiva.  ¿Qué  pasaría  con  el  costo  de  la  tecnología 
si  se  dejara  de  producir  energía  solar  durante 
los  próximos  10  años?  Es  de  esperar  que  se 
frene  la  curva  de  aprendizaje,  no  se  acumule  conocimiento,  y  el  precio  se  mantenga 
pese  al  transcurso  del  tiempo.  Como  “año”  es  una  variable  proxy  de  la  producción,  no 
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existe  certeza  de  que  en  el  año  2028  tengamos  precios  competitivos  si  es  que  no  se  sigue 
invirtiendo  esfuerzos  en  mejorar  la  tecnología.  En  (1.4)  se  estimó  una  correlación  espuria. 

De  forma  irónica,  en  la  figura  1.13  se 
presenta  la  proyección  del  número  de  ma¬ 
trimonios  que  tendrá  la  novia  si  siguiera 
con  uno  al  día.  El  ejemplo  es  obviamen¬ 
te  una  exageración,  y  la  novia  no  tendrá 
que  comprar  tantas  tortas  de  matrimonio,  pe¬ 
ro  la  idea  se  aplica  a  problemas  prácticos 
que  a  veces  no  son  tan  obvios.  Incluso  es¬ 
pecialistas  en  ocasiones  caen  en  la  tram¬ 
pa  de  interpretar  correlaciones  como  causali¬ 
dad. 

En  conclusión,  el  R2  sirve  para  evaluar  la  bondad  de  ajuste  (corresponde  a  un  indica¬ 
dor  de  cuán  importantes  son  las  variables  omitidas  para  la  determinación  de  y,  pues  dicha 
importancia  repercute  en  la  varianza  del  error  y  en  la  de  los  residuos,  como  también 
podría  a  ayudar  a  detectar  problemas  como,  por  ejemplo,  el  del  gráfico  1.9f,  donde  se 
estima  una  relación  lineal  cuando  no  corresponde)  pero  no  es  un  criterio  robusto  para 
elegir  el  mejor  modelo,  especialmente  cuando  el  objetivo  es  hacer  una  predicción  fuera 
del  rango  de  los  valores  X  observados. 

En  fin,  siempre  recuerde:  una  correlación  alta  (un  alto  R 2)  no  implica  de  causalidad. 

Coeficiente  de  determinación 

El  comando  asociado  es  $r  sq.  Puede  utilizarlo  de  dos  maneras.  La  primera  es  tras  estimar  una  regresión 
MCO,  por  ejemplo: 

oís  y  const  xl  x2  x3 
scalar  Rcuadrado  =  $rsq 

La  segunda  es  dando  nombre  a  la  regresión: 

MiReg  <-  oís  y  const  xl  x2  x3 
scalar  Rcuadrado  =  MiReg. $rsq 


Figura  1.13:  Proyección  causal 


ASVWCAN5EE,  8/ USTE 
NEXTIWm  YOUUHAVE 
OVER  RJUR  DOZEKI  HU5EWD5. 

BETTERGETA 
SUXRATFON 


1 .5  Transformaciones  para  la  linealidad 

Muchas  veces  deseamos  estudiar  la  relación  entre  dos  o  más  variables  cuya  relación 
no  es  lineal.  Un  ejemplo  es  el  de  la  figura  1.14a.  Uno  podría  estar  interesado  en  predecir 
la  fertilidad  de  un  país  en  vías  de  desarrollo  considerando  que  en  algunas  décadas  más 
su  nivel  de  ingreso  per  cápita  será  superior  y  la  tenencia  de  hijos  probablemente  se 
asimilaría  más  a  la  de  un  país  desarrollado.  Si  ya  se  tiene  una  predicción  del  ingreso 
medio  que  tendrá  el  país,  la  pregunta  es  qué  parámetros  gobiernan  la  relación 

Fertilidad  =  /(Ingreso). 

Claramente,  fertilidad  e  ingreso  no  tienen  una  relación  lineal.  ¿Qué  se  puede  hacer  para 
aplicar  el  modelo  MCO  en  este  caso? 


1 .5  Transformaciones  para  la  linealidad 
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Figura  1.14:  Transformaciones  logarítmicas  eniej 


Una  posible  solución  consiste  en  transformar  las  variables  Fertilidad  e  Ingreso  de 
manera  tal  que  se  obtenga  una  relación  lineal.  Es  decir,  buscamos  funciones  g(-)  para 
ambas  variables  tales  que 

gy  (Fertilidad)  =  /3o  +  pigx  (Ingreso)  +  u. 

¿Qué  forma  funcional  elegir  para  gy(-)  y  £*(•)?  Para  linealizar  la  relación  de  la 
figura  1.14a  aplicaremos  en  ambos  ejes  un  función  que  cumpla  con  g'(-)  >  0  y  g"(-)  <  0. 
Funciones  que  cumple  con  esta  característica  son,  por  ejemplo,  g(z)  =  ln(z),  g(z)  =  y/z 
y  g(z)  =  z4 .  Todas  ellas  tienen  en  común  que  acercan  en  mayor  proporción  a  los  puntos 
alejados  del  eje  y  en  menor  proporción  a  los  puntos  cercanos  al  eje,  tal  cual  se  representa 
en  la  figura  1.15. 

Lo  habitual  es  elegir  a  g(-)  =  ln(-)  en  lugar  de  otra  función  similar.  Esto  se  debe 
a  que  una  regresión  de  la  formas  log-log,  nivel-log  y  log-nivel  tendrá  una  de  las 
prácticas  interpretaciones  presentadas  en  la  tabla  1.4. 

La  figura  1.14  muestra  cómo  con  cambia  el  ordenamiento  de  los  datos  al  aplicar 
g  =  ln(-),  primero  en  el  eje  vertical ,  luego  en  el  eje  horizontal  y,  por  último,  en  ambos 
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Tabla  1.4:  Transformaciones  comunes 


Denominación 

Especificación 

Diferencial  total 

Interpretación 

nivel-nivel 

y  =  l 3i+j32x 

Ay  =  /32Ar 

Si  x  aumenta  en  una  unidad, 
entonces  y  aumenta  en  j32 
unidades. 

log-log 

lny  =  j3i  +  /32ln.x 

II 

5» 

H£r 

Si  x  aumenta  en  1  %,  enton¬ 
ces  y  aumenta  en  j82  % 

nivel-log 

y  =  P  i  +  A>lnx 

A y  =  í&T 

Si  x  aumenta  en  1  %,  enton¬ 
ces  y  aumenta  en  j82/100  uni¬ 
dades. 

log-nivel 

lny  =  J3i  +fi2x 

f  =  PiAx 

Si  x  aumenta  en  una  uni¬ 
dad,  entonces  y  aumenta  en 
100j32% 

ejes  a  la  vez. 

Figura  1.15:  Transformación  g(-)  con 

g'(-)  >0yg"(-)  <0 


La  línea  de  regresión  de  la  figura  1 . 14d  es 

ln (Fertilidad)  =  3,55  -  0,291n(Ingreso). 

Los  resultados  se  interpretan  así:  un  aumen¬ 
to  en,  por  ejemplo,  10%  del  ingreso  de 
un  país  genera  una  disminución  de  la  ta¬ 
sa  de  fertilidad  en  2,9%;  duplicar  el  ingre¬ 
so,  por  ejemplo,  hace  caer  la  tasa  de  fertili¬ 
dad  a,  aproximadamente,  2/3  de  su  nivel  ini¬ 
cial. 


Por  supuesto,  la  transformación  logarítmi¬ 
ca  no  siempre  es  adecuada.  Un  ejemplo  es  el 
que  se  presenta  en  la  figura  1.16a.  Si  bien  aplicar  la  transformación  logarítmica  en  el 
eje  x  ayuda  a  linealizar  la  relación,  el  eje  y  necesita  la  transformación  inversa,  es  decir 
un  operador  que  cumpla  con  g"(-)  >  0.  En  la  figura  1.16b  se  muestra  el  ajuste  lineal 
aplicando  g(y)  =  y2. 


GRETL:  Transformaciones 

Vía  el  comando  series  es  posible  utilizar  las  funciones  ln(x)  ,  exp(x),  x~2,  x~0 . 5,  etc.  Además 
existen  transformaciones  rápidas  para  múltiples  series  a  la  vez.  Por  ejemplo 

logs  Costo  ProdAcum 
squares  Costo  ProdAcum 

crea  los  logaritmos  de  ambas  variables  y  sus  cuadrados  (con  prefijos  1_  y  sq_  respectivamente). 

Otra  alternativa  cuando  las  relaciones  no  son  lineales  es  estimar  una  regresión 
polinomial  de  orden  m: 

y¡  =  Pi+  p2Xi  +  faxf  +  •••  +  A OÍ”1  + 


1 .5  Transformaciones  para  la  linealidad 
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Figura  1.16:  Expectativas  de  vida  vs.  ingreso  per  cápita 


(a)  Datos  sin  transformar 


(b)  Transformaciones  y2,  ln(x) 


Ingreso  medio  ,io4 


Ingreso  medio  ,iq4 


donde  m  =  k—l  en  este  caso.  Las  figuras  1.16c  y  1.1 6d  presentan  ajustes  polinomiales 
de  orden  2  y  3  respectivamente.  A  medida  que  aumentamos  el  orden  m  de  la  regresión 
polinomial  siempre  mejora  la  calidad  del  ajuste  intra  muestra. 

Otro  tipo  de  ajuste  común  es  el  ajuste  inverso: 

y  =  Pi  +  p2l  (1.13) 

Note  que  en  (1.13)  el  valor  asintótico  de  la  variable  dependiente  es  y  — >  ft\. 

En  la  figura  1.17  se  presenta  el  ajuste  para  dos  de  nuestros  ejemplos.  Claramente  el 
ajuste  no  es  de  la  mejor  calidad  para  los  países  con  alto  nivel  de  ingreso.  Este  es  un 
problema  habitual  del  ajuste  inverso. 
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Figura  1.17:  Ajuste  inverso:  y  =  j8i  + 


(a)y  =  76,2-l,59e  +  004i 


(b)  y  =  2,21+2,21e  +  003  \ 


0  2  4  6  8 

Ingreso  medio  ,io4 


0  2  4  6  8 

Ingreso  medio  ,io4 


1.6  ¡Esos  outliers! 

Vimos  que  un  alto  R2  no  necesariamente  implica  un  buen  modelo.  En  particular,  si  la 
correlación  es  espuria,  no  hay  causalidad  directa  y  la  predicción  pierde  validez.  En  mu¬ 
chos  casos  es  difícil  establecer  si  la  causalidad  va  efectivamente  de  X  a  y,  pero  en  otros 
casos  es  fácil.  Sabemos  que  la  nubosidad  es  un  predictor  de  la  lluvia,  como  sabemos 
que  el  metraje  de  una  propiedad  determina  su  precio  y  no  viceversa.  Restringiéndonos 
a  casos  en  que  la  causalidad  está  clara,  ¿es  el  R2  un  buen  indicador  de  la  bondad  del 
modelo? 

La  respuesta  se  encuentra  en  la  figura  1.18,  donde  presenta  4  regresiones  MCO  con 
el  mismo  R2.  Este  cuarteto,  bautizado  en  honor  a  Francis  Anscombe,  (i)  muestra  cómo 
el  R2  puede  ser  engañoso  para  juzgar  la  calidad  del  ajuste  de  un  modelo  y  (ii)  ilustra 
algunas  debilidades  de  la  regresión  MCO  . 

¿Por  qué  es  el  R2  en  1.18a  igual  que  en  los  otros  casos  si  la  relación  parece  bien 
capturada  por  la  recta?  La  razón  se  encuentra  en  que  los  errores  tienen  una  alta  varianza. 
Esto  suele  se  el  caso  cuando  se  dejan  muchas  variables  dentro  del  término  de  error. 
Aunque  el  modelo  estimado  acá  sea  correcto,  el  R2  es  bajo. 

El  problema  de  1.18b  es  la  no  linealidad  de  la  relación.  Por  ahora  queda  claro  que 
graficar  los  datos  es  importante  para  no  cometer  este  tipo  de  error  en  la  práctica.  Más 
adelante  veremos  una  metodología  para  detectar  el  problema  cuando  existen  muchos 
regresores  y  la  detección  gráfica  se  dificulta. 

En  las  figuras  1.18c  y  1.1 8d  se  presentan  outliers.  Ese  es  el  nombre  que  se  le  da  a 
observaciones  que  distan  de  la  relación  típica  observada  entre  los  datos.  Note  que  se 
hace  una  diferenciación  entre  outliers  verticales  y  horizontales,  pues  el  efecto  que  tienen 
sobre  una  estimación  es  desigual. 

La  peor  regresión  de  la  figura  1.18  es  sin  duda  la  última.  Esta  regresión  padece  de  un 
problema  denominado  valor  influyente.  Llamaremos  valor  influyente  a  un  punto  que 
cuenta  con  dos  características: 


1.6  ¡Esos  outliers! 
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Figura  1.18:  El  cuarteto  de  Anscombe 
(a)  Errores  dispersos  (b)  No  linealidad 
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1.  Es  un  outlier:  se  encuentra  considerablemente  alejado  de  la  recta  poblacional. 

2.  Tiene  alto  apalancamiento:  se  encuentra  considerablemente  alejado  de  la 
media  en  el  dominio  del  eje  x. 

Para  ilustrar  como  son  sólo  los  valores  influyentes  los  que  inciden  fuertemente  en 
una  estimación,  la  figura  1.19  presenta  una  serie  de  estimaciones  MCO,  donde  cada 
recta  se  obtuvo  mediante  una  regresión  con  la  variable  del  eje  vertical  como  variable 
dependiente  y  la  variable  del  eje  horizontal  como  regresor. 

Vemos  que  no  en  todos  los  casos  se  distorsiona  la  estimación,  pues  se  tienen  que  cumplir 
1  y  2  para  ello.  Por  ejemplo,  la  regresión  de  Z3  respecto  a  Z2  se  ve  fuertemente  distor¬ 
sionada  por  el  outlier  mientras  la  regresión  de  Z3  respecto  a  Z3  no  presenta  alteración 
en  la  pendiente,  pese  a  que  los  datos  son  exactamente  los  mismos,  sólo  que  cambiados 
de  la  mano  izquierda  de  la  regresión  a  la  mano  derecha  y  viceversa.  El  mismo  fenómeno 
se  observa  también  entre  Z4  y  Z3,  donde  se  ve  que  cuando  Z4  es  variable  dependiente  el 
único  efecto  del  outlier  es  un  pequeño  cambio  en  la  constante  (la  recta  está  levemente 
más  arriba). 

Cuando  se  realizan  regresiones  entre  dos  variables  es  fácil  verificar  la  presencia  de 
puntos  de  apalancamiento  gráficamente.  ¿Cómo  se  hace  cuando  k>  2,  es  decir,  cuando 
hay  más  de  un  regresor? 


El  apalancamiento  se  puede  cuantificar  con  ayuda  de  la  hat  matrix, 
H  =X(X'X)~lX', 


(1.14) 
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Figura  1.19:  Outliers  verticales  vs.  outliers  horizontales 


cuyos  n  elementos  diagonales  h¡  =  Ha  se  caracterizan  por: 

■  Su  valor  está  entre  cero  y  uno 

■  Su  valor  aumenta  con  la  distancia  de  X  respecto  de  la  media  de  X. 

Las  figuras  1.21  y  1.20  ilustran  la  relación  que  existe  entre  el  apalancamiento  y  la 
distancia  de  la  media  de  X.  Japón  tiene  un  alto  nivel  de  h¡  debido  que  tiene  el  menor 
nivel  de  inequidad  en  1950,  Suiza  tiene  un  alto  nivel  por  tener  el  mayor  nivel  de  ingreso 
en  1950  y  la  India  tiene  el  mayor  nivel  de  h¡  debido  a  que  tiene  tanto  el  mayor  nivel  de 
inequidad  en  1950  como  el  menor  ingreso  en  1950. 

Una  pregunta  natural  es:  ¿qué  niveles  de  h¡  se  consideran  preocupantes?  Algunos 
autores  sugieren  revisar  qué  ocurre  con  datos  que  tienen  hi  >  2  •  k/n.  En  el  caso  de 
la  regresión  M3,  2  •  k/n  =  2-  3/12  =  0,5.  El  único  país  con  h¡  >  0,5  es  la  India.  Esto 
significa  que  sería  recomendable  intentar  incorporar  un  nuevo  país  a  la  base  de  datos 
con  características  similares  a  la  India  para  ver  si  los  resultados  de  M3  son  robustos. 


Pero,  tal  como  se  ilustra  en  la  regresión  de  Z2  respecto  a  Z2  (o  Z4  respecto  a  Z4),  que 


1.6  ¡Esos  outliers! 
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(a)  Z1  =  J3i  +  J32Z3 


Figura  1.21:  Apalancamiento  (h¿) 
(b)ZÍ  =  j3!+j32Z4 


(c)  Z4  =  +J32Z4 
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Figura  1.22:  Influencia  (/i¡m¡/(  1  —  h¡)) 


(a)  Z1  =  ft  +  j32Z3  (b)  Z1  =  j3i  +  j82Z4 


(c)  Z4  =  j3i  +J32Z4 
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una  observación  tenga  un  alto  nivel  de  apalancamiento  no  implica  que  tenga  influencia 
(impacto  sobre  la  recta  estimada),  la  cual  se  mide  con 


hiü¡  ü¡ 


(1.15) 


En  la  figuras  1.21b  y  1.21c  se 
muestra  cómo  las  regresiones  respec¬ 
tivas  tienen  el  mismo  apalancamiento 
en  sus  n  obseraciones  (la  línea  puntea¬ 
da  representa  2  •  k/n  y  muestra  la  pre¬ 
sencia  de  una  observación  peligrosa) 
pero  sólo  en  la  regresión  de  Z1  res¬ 
pecto  a  Z4  el  outlier  está  generando 
presión  sobre  la  pendiente  estimada. 

Cuando  se  detecta  un  valor  influ¬ 
yente,  ¿qué  se  hace?  Si  queda  claro 
que  la  observación  es  un  outlier  por 
motivos  de,  por  ejemplo,  un  error  de 
tipeo,  entonces  el  dato  debiera  ser  co¬ 
rregido  o,  en  última  instancia,  elimi¬ 
nado. 


Figura  1.20:  Apalancamiento  en  M3 


Hay  quienes  sucumben  ante  la  tentación  de  eliminar  las  observaciones  “molestosas”, 
incluso  cuando  no  se  ha  comprobado  que  presentan  errores  de  medición.  Esta  no  es 
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una  práctica  aceptable  en  la  econometría,  salvo  que  existan  argumentos  muy  fuertes 
que  respalden  dicha  decisión.  Muchas  veces  existen  mejoras  al  modelo  que  permiten 
mantener  la  totalidad  de  las  observaciones.  ¡Una  observación  no  debe  ser  eliminada  sólo 
porque  no  calza  con  el  ideal  del  investigador! 


Figura  1.23:  ¡Fuera  mentiroso! 


H:  Influencia 

El  comando  leverage  tras  una  regresión  oís 
presenta  niveles  de  apalancamiento  e  influencia. 

TO  DO:  Incorporar  párrafo  sobre 
control  con  dummies 


